ECHANTILLONNAGE - ESTIMATION 


- Partie A - Echantillonnage - 

L'objectif de cette partie est de repondre a la problematique suivante : comment, a partir d' informations (couple 
moyenne -ecart-type ou proportion) connues sur une population, peut-on prevoir celles d'un echantillon ? 


Nous distinguerons deux cas : celui ou Ton etudie une moyenne dans un echantillon et celui ou Ton etudie une 
proportion dans un echantillon. 


A.1. Etude de la moyenne d'un echantillon 


On dispose d'une population sur laquelle est definie une variable aleatoire X dont on connait l'esperance (ou la 
moyenne) li et l'ecart-type a. 

Population 


Echantillons de taille n 


{ 



On s'interesse aux echantillons de taille n. Auront-ils tous la meme moyenne ? Non, certains peuvent etre 
constitues d'elements atypiques et avoir une moyenne tres differente de celle de la population (surtout si 
l'echantillon est de petite taille). 

Notons X la variable aleatoire qui, a chaque echantillon de taille n, associe sa moyenne ( X s’appelle encore la 
distribution des moyennes des echantillons). Que peut-on dire de cette variable aleatoire X ? 


Theoreme Central Limite - Version 1 - (Version faibie) 

Contexte : variable aleatoire X qui suit une loi normale sur la population 

X N(p ■ a) 

On preleve, au hasard, un echantillon (tirages avec remise 11 ’ ou assimiles) de taille n de moyenne X . 
Alors la variable aleatoire X suit egalement une loi normale : 

\ 

a 


/ 


X N 


; 
v 


Attenuation de la dispersion par 
le processus d’echantillonnage. 


^ Un tirage avec remise est encore appele "tirage non exhaustif'. Si on fait un tirage sans remise (tirage exhaustif), on modifie la taille de la 
population au fur et a mesure des tirages, ce qui compliquerait les calculs (intervention d'un facteur d'exhaustivite). Ceci dit, pour des grandes 
populations le tirage sans remise s'assimile a un tirage avec remise. 
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Demonstration : 


Notons E = {x i ; *2 ; ... ; x„} un echantillon de n elements preleves au hasard dans la population. 

Pour tout i compris entre 1 et n, notons X, la variable aleatoire correspondant a la valeur du i-eme element x, de 
l'echantillon. Nous savons, par hypothese, que : 

E(Xi) = p et ct(X ; ) = o 

La moyenne X des n valeurs de l'echantillon est : 

V. X 1+ X 2+ ...+ X„ 
n 

D'apres les proprietes de la loi normale, nous savons qu’une combinaison lineraire de variables aleatoire qui 
suivent la loi normale est encore une variable aleatoire qui suit la loi normale. Comme chaque variable 
aleatoire X, suit ici la loi normale /V(p, a), la variable aleatoire moyenne X suit done egalement une loi 
normale. Calculons ses parametres. 

D'apres la propriete de linearite de l’esperance : 

E(X l ) + E(X 2 ) + ...+ E(X„) _ 
v ' n n 


D'apres les proprietes de la variance : 


-x V(X 1 ) + V(X 2 ) + ... + V(X„) 


v(x) = 


no 


a 

n 


D’ou : 


<*(*)= 


a 


•Jn 


Theoreme Central Limite - Version 2 - (Version forte) 

Contexte : variable aleatoire X qui suit une loi quelconque sur la population avec E(X) - u et a(X) = a. 
On preleve, au hasard, un echantillon (tirages avec remise ou assimiles) de taille n, avec n > 30, de moyenne X . 


Alors la variable aleatoire X suit approximativement une loi normale : 


X N 


p; 


yfn 


Ce theoreme du aux mathematiciens De Moivre et Laplace est de demonstration tres difficile. II est admis ici. 

Remarque : il ne faut pas confondre l’ecart-type ~^= de la variable aleatoire X (qui est definie sur l’ensemble 

yjn 

des echantillons possibles de taille n) avec l’ecart-type d'un echantillon preleve. L’ecart-type de l'echantillon 
preleve n'interviendra pas dans nos calculs dans cette partie. Pour eviter cette confusion, la quantite ~^= sera 


parfois appelee "erreur type" . 


Exemple : 

Les statistiques des notes obtenues en mathematiques au BAC STI en France pour l'annee 2006 sont : 

Moyenne nationale : li =10,44 
Ecart-type : a = 1 ,46 

Une classe de BTS comporte 35 eleves en 2006/2007 issus d'un BAC STI en 2006. 
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Calculer la probability que la moyenne de cette classe soit superieure a 10. 


Ici, nous ne connaissons pas la loi sur la population, mais l'effectif n de l’echantillon est superieur a 30. 
Nous allons done pouvoir utiliser le T.C.L. 2. 

Notons X la variable aleatoire qui, a tout echantillon de taille n = 35, fait correspondre sa moyenne. 


Alors : 


X N 


p; 


y/n 


= N 


10,44; 


1,46 

V35 


Posons T = 


X -10,44 


1,46 

V35 


ainsi T 


N ( 0 ; 1). 


Nous obtenons alors par centrage et reduction : 

f \ 


P( X > 10) = P 


X -10,44 > 10-10,44 


1,46 

V35 


1,46 

V35 


= P(T7z- 1,78) 
= p(r< i,78) 

= n(i,78) 



Et par lecture directe de la table de la loi normale centree-reduite ; 


n( 1,78) = 0,9625 


Conclusion : il y a environ 96% de chance que, dans cette classe de BTS, la moyenne des notes au baccalaureat 
de Mathematiques soit superieure a 10. 


A.2. Etude d'une proportion dans un echantillon 

Cette fois-ci, on dispose d’une population sur laquelle on etudie un caractere (ou attribut) A dont on connait la 
proportion p dans la population. Population 



On s'interesse aux echantillons de taille n. La proportion du caractere A dans les echantillons sera-t-elle 
toujours la meme ? Evidemment non, cette proportion varie en fonction de l'echantillon choisi. Notons F la 
variable aleatoire qui, a chaque echantillon de taille n, associe sa proportion du caractere A (F s'appelle 
distribution des frequence des echantillons ). Que peut-on dire de cette variable aleatoire F ? 
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Theoreme 

Contexte : une population sur laquelle on etudie un caractere A repandu avec une frequence p. 
On preleve, au hasard, un echantillon (tirages avec remise ou assimiles) de taille n avec n > 30. 

On note F la frequence du caractere A dans l'echantillon. 

Alors la variable aleatoire F suit approximativement une loi normale : 


N 


P\ 


PO-P) 


Demonstration : 

Nous allons avoir ici un modele binomial ou apparente dont on sait qu’il converge vers la loi normale. 

Pour tout i compris entre 1 et n , notons X , la variable aleatoire definie par : 

[l si le i-eme element de l'echantillon possede l'attribut A 
Xj = S 

[0 sinon 


La variable aleatoire X, suit une loi de Bernoulli de parametre p. 

La variable aleatoire X = X\ + X 2 + ... + X„ est done binomiale de parametres n et p : 

X B{n, p) 

En consequence : E(X) = np et a(X) = -Jnp(\ - p) 

X 

La variable aleatoire F = — correpond ainsi a la frequence de l'attribut A dans l'echantillon. 

n 

D’apres les proprietes de l'esperance et de l'ecart-type : 

EiF)=^l = pc t a(F,= ^= 

n n V n 


Exemple : 

Une election a eu lieu et un candidat a eu 40 % des voix. 

On preleve un echantillon de 100 bulletins de vote. 

Quelle est la probabilite que, dans l'echantillon, le candidat ait entre 35 % et 45 % des voix ? 


Ici, nous avons n = 100 et p = 0,4. La variable aleatoire F correspondant a la frequence des votes pour le 
candidat dans l'echantillon verifie done : 


F 


N 


0,4; 


04x06 ' 
100 


= N 


04; 


VQ24 

10 


\ 


y 


Posons T = — . ainsi T Af(0 ; 1). Nous obtenons alors par centrage et reduction : 

V024 

10 

P(0,35 < F < 0,45) = P(-l,02 < T < 1,02) = 2n(l,02) - 1 
Et par lecture directe de la table de la loi normale centree-reduite 11(1,02) = 0,8461. 

D'ou : P(0,35 < F < 0,45) = 0,6922 

II y a done environ 69 % de chance que, dans un echantillon de taille n = 100, le candidat ait entre 35 % et 
45 % des voix. 
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Eii analysant l'exercice ci-dessus, on constate que Ton dispose des informations sur la population (ici, 
l’ensemble des votes) parce que l'election a deja eu lieu. On en deduit des informations sur l'echantillon. Mais, 
dans la pratique, c'est souvent le phenomene reciproque que nous etudierons : les elections n'ont pas encore eu 
lieu et on voudrait retrouver les informations sur la population grace un sondage realise sur un echantillon. 
D’ou la deuxieme partie de ce document consacree a l'estimation. 


- Partie B - Estimation - 

L'objectif de cette partie est de repondre a la problematique suivante : comment, a partir d' informations (couple 
moyenne/ecart-type ou proportion ) calculees sur un echantillon, retrouver ou plutot estimer celles d'une 
population entiere ? L'estimation est le probleme reciproque de l'echantillonnage. (Mais nous aurons besoin des resultats 
etablis sur la theorie de l'echantillonnage pour passer a la phase estimative). 


Nous distinguerons deux cas : celui ou l'on cherche a estimer la moyenne li d'une variable aleatoire definie sur 


une population et celui ou Ton cherche a estimer la 
population. 


ESTIMATION d’une MOYENNE 

Population 



proportion d’individus p ayant tel caractere dans la 


ESTIMATION d’une PROPORTION 

Population 



B.l. Estimation d'une moyenne 


B.1.1. Estimation ponctuelle 

Contexte : on considere une variable aleatoire X sur une population de moyenne (ou esperance) li inconnue et 
d’ecart-type o inconnu (ou connu). On suppose que l'on a preleve un echantillon de taille n (tirage avec remise 
ou assimile) sur lequel on a calcule la moyenne p e et l'ecart-type a e . 


Une estimation ponctuelle 'p' de la moyenne li de la population est : 

P = Pe 

Une estimation ponctuelle o' de l’ecart-type c e de la population est : 


/X 

o = 
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Le coefficient 


n 


n — I 


s'appelle correction de biais. Lorsque la taille n de l'echantillon est assez grand (cn 


pratique n > 30), ce coefficient est tres voisin de 1 , si bien que, dans ce cas, on peut estimer cr — a e . 


Exemple : 

Une universite comporte 1500 etudiants. On mesure la taille de 20 d'entre eux. La moyenne p e et l'ecart-type a e 
calcules a partir de cet echantillon sont : 


p e = 176 cm et o e = 6 cm 

Nous pouvons done estimer les parametres de la population : 


p = 176 cm et o = 



6,16 cm 


Remarque : 

Nous n'avons fait qu'une estimation, il est bien sur impossible de retrouver les vraies caracteristiques p et o de 
la population. 

L'estimation ponctuelle permet surtout de disposer d’une valeur de reference pour poursuivre/affiner les calculs. 
On souhaiterait notamment pouvoir faire une estimation par intervalle, en controlant le risque pris. 

B.1.2. Estimation par intervalle de confiance 

Le contexte est le meme que le precedent, sauf que nous allons raisonner en deux temps, une phase a priori (ou 
previsionnelle) dans lequelle on suppose que l'echantillon n'est pas encore preleve et une phase a posteriori 
dans laquelle on suppose connue la moyenne p e et l'ecart-type cr L . de l'echantillon et done la moyenne estimee p' 
et l’ecart-type estime o' de la population. 


- PHASE A PRIORI - Mise en place du modele previsionnel - 

Nous avons vu, dans la theorie sur l’echantillonnage, que si X est la variable aleatoire correspondant a la 
moyenne d’un echantillon de taille n pris au hasard, alors le Theoreme Central Limite permet d’affirmer que X 
suit approximativement une loi normale : 


R ; —j= 
V V« 


X N 

Nous allons chercher un intervalle qui contient p avec une confiance arbitraire de 95% (cela pounait aussi etre 99% < 


un autre coefficient de confiance). Nous cherchons done un rayon r tel que : 


Probability que la moyenne \i de la 
population tombe dans un intervalle 
du type [ X - r ; X + r] 


P( X - r < p < A + r) = 0,95 


-H- 


p X 


X-r 


- 3 - 

X + r 
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Cette disposition des inegalites n'est pas pratique mais il y a une correspondance remarquable entre deux 
evenements qui va nous faciliter les calculs : 

X - r < p < X + r 

Retranchons X et p dans chaque membre : 

-p-r<-X<r-p 

Multiplions par -1: r+p^X^p-r 

Remettons les inegalites dans l'ordre croissant : 

p-r<X<r+p 

Nous sommes ainsi ramenes a calculer : 


Cette propriete decoule de la 
symetrie de la valeur absolue : 

I X-Y\<r 

Cela signifie que l'ecart entre X 
et Y est inferieur a r, ce qui s'ecrit 
indifferemment : 

-r^X-Y^ r 
Y-r^X^Y+r 
Ou encore : 

-r < Y-X^r 
X-r^Y^X+r 



X p 

m3 


p-r 


p + r 


On sait que la variable aleatoire T = — — — = ^-(X - p) suit la loi normale centree-reduite MO ; 1). 

o a v ' 

•Jn 

Nous obtenons done, par centrage et reduction : 


p-r-p X - p p + r-p 

^ ^ 

a a a 

~Jn ~Jn yfn 


= 0,95 


f ryfn r^fn 




= 0,95 


r\fn . r\[n 




= 0,95 


f 


2U 


\fn 


v ° y 


- 1 = 0,95 


n 


f r\ 

r\ln 


v ° y 


= 0,975 


IR» = 0,975 ou t = 


rVn 


On constate ici que le fait de ne pas 
connaitre p n'est pas genant, a ce stade. 




Rappel : si T 

M0 

; 1 ) alors : 

P(-a 

/A 

/A 

a) = 211(a) -1 

En effet : 



P(-a s; 7 

« a) 

= n(a) - n(-a) 



= n(a)-(l-n(a)) 



= 211(a) -1 


Nous cherchons done, par lecture inverse de la table de la loi normale centree reduite une borne t telle que : 

IIO) = 0,975 

La borne t = 1,96 convient. 

La borne t depend du coefficient de confiance choisi. 

Avec un coefficient de confiance de 99%, nous aurions obtenu : 


2U 


f r\ 
\Jn 


v ° y 


- 1 = 0,99 
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no) = 0,995 
t = 2,575 


Par la suite, nous noterons t le reel tel que 211(f) - 1 = C ou C est le degre de confiance choisi. 


Ainsi, notre reel r recherche est tel que : 



= t 


Le rayon r de l'intervalle cherche est : 



- PHASE A POSTERIORI - Utilisation des valeurs estimees ponctuellement - 
Nous supposons maintenant que l’echantillon a ete tire, nous obtenons done une representation p e de la 
variable aleatoire X : 

M Me 

[ I I ] 

I J-c-r He + r 


Nous pouvons affirmer que l’intervalle obtenu pour cet echantillon 


o o 

v e ~t-j= ; ^ e + t- r 
y]n yjn 


fait partie d’une famille dans laquelle 95 % contiennent la vraie moyenne li de la population. 
On l'appelle intervalle de confiance a 95 % (ou autre selon le coefficient de confiance decide prealablement). 


Pour calculer les bornes de cet intervalle, deux cas de figure se presentent selon que nous connaissons ou pas 
l'ecart-type ct de la population. S'il est connu, il n'y a rien a faire : 


1C = 


o o 

: Ve + t ~r 

yjn yjll 


Si l’ecart-type o de la population n'est pas connu, on le remplace par son estimation ponctuelle o' = , / o,.. 


n-1 


Dans ce cas, nous obtenons : 


r = t. £== t- 


1 12 - 1 -Jn yjn — l 

Nous pouvons done estimer avec une confiance de 95 % (ou 99 % selon le cas) que la moyenne li de la 
population appartient a l'intervalle : 

c>„ 


IC = 


H e -t- r = ; p e +f- 

V 12 — 1 V 12 — 1 


On ne retiendra pas cette formule. 
Dans la pratique, on refait les calculs. 


Remarques : 

• L'intervalle de confiance est centre en la valeur li c car e’est la seule valeur de reference que nous disposons. 

• Le centre de l’intervalle de confiance (a savoir u e ) depend de l'echantillon choisi (puisque u e en depend). 
Son rayon en depend aussi lorsqu'on ne connait pas l'ecart-type de la population. 

• La vraie valeur li de la moyenne de la population peut ne pas appartenir a l’intervalle de confiance. 

• Le rayon de l’intervalle de confiance (a savoir la quantite r =t —. L ) depend du degre de confiance C choisi. 

Vll 

Plus le degre de confiance C est proche de 100%, et plus la borne 1 sera elevee et done le rayon grand. 
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Illustration : 


Population 




Echantillon 1 


Echantillon 2 


Echantillon 3 



95% 


Un intervalle de 
confiance ne contient 
pas forcement la 
moyenne p de la 
population. 

Un intervalle de 
confiance a 95 % est 
plus petit qu'un 
intervalle de confiance 
a 99%. II risque moins 
de contenir la valeur 
moyenne p. 


Exemple : 

Une universite comporte 1500 etudiants. On mesure la taille de 20 d'entre eux. La moyenne p e et l'ecart-type a e 
calcules a partir de cet echantillon sont : 

p e = 176 cm et a e = 6 cm 

Nous avons deja estime ponctuellement les parametres de la population : 

p' = 176 cm et o' = , — x 6 — 6,16 cm 
V 19 

Determinons maintenant une estimation de p par intervalle de confiance a 95% (ou au risque de 5 %). 

Notons X la variable aleatoire correspondant a la moyenne d'un echantillon de taille 20 pris au hasard. 


Nous savons que : 


On calcule un rayon r tel que : 


X N 


n;-H = N 

\ /n 


M- 


’ V20 

P(p - r < X < p + r) = 0,95 


X — r 

On pose T = , ainsi T suit la loi normale centree-reduite N(0 ; 1). 

a 


V20 

Nous avons done : 


rV20 rV20 

^ I 


= 0,95 


2n 


rV20 


V a / 


n 


r V20 


v a y 


n(0 = 0,975 ou t = 


- 1 = 0,95 

= 0,975 

rV 20 


Nous cherchons done, par lecture inverse de la table de la loi normale centree reduite une borne t telle que : 

no) = 0,975 

La borne 1 = 1,96 convient. 

rV 20 


Ainsi, notre reel r recherche est tel que : 


= 1,96 
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1, 96 x a 

r= ^JW 

Mais une fois l'echantillon tire, nous avons obtenu un ecart-type estime a ^ 6,16 cm. 

D'ou : r ^ 2,7 

La realisation de l'intervalle de confiance a 95% sur cet echantillon est : 

7C= [176-2,7 ; 176 + 2,7] 

IC= [173,3 ; 178,7] 

Nous pouvons done estimer, avec une confiance de 95 % que la taille moyenne de la population est comprise 
entre 173,3 cm et 178,7 cm. 


B.2. Estimation d’une proportion 

B.2.1. Estimation ponctuelle 

Contexte : on considere un caractere (ou attribut) A sur une population dont la proportion p est inconnue. On 
suppose que Ton a preleve un echantillon de taille n (tirage avec remise ou assimile) sur lequel on a calcule la 
proportion p e d'individus ayant le caractere A. 

Notons F la variable aleatoire correspondant a la proportion du caractere A dans un echantillon de taille n pris 
au hasard. On rappelle qu’alors F suit approximativement une loi normale : 

F N(p;a p ) oua,= ^^-^ 


Une estimation ponctuelle p' de la proportion p de l’attribut A dans la population est : 

P =Pe 

Une estimation ponctuelle a], de l'ecart-type a p est selon le cas : 



PeO-/L) 


n — 1 


si n < 30 


PeO-Pc) 


si n > 30 



si statisticien pessimiste 


Correction de biais. 


Ces estimations ponctuelles de 
l'ecart-type ne sont pas utiles dans 
l'immediat. Elle serviront pour la 
determination d'un intervalle de 
confiance de la proportion. 


Exemple : 

A quelques jours d'une election, un candidat fait effectuer un sondage. Sur les 150 personnes interrogees, 45 se 
disent pretes a voter pour lui aux prochaines elections. 


La proportion d'individus prete a voter pour ce candidat dans l'echantillon est ici de p e = 


0,3. 


On estime done qu’il en est de meme dans la population (comment pourrait-on faire autrement ?) : 

P' = Pe = 0,3 

Quand a l'indication a p , on peut ici l’estimer par : 

. IMzM. (0+107 _ 0 037 

p v n V 150 
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On voudrait aller plus loin et, au lieu d'une simple proportion, calculer un intervalle contenant, avec une 
confiance arbitraire fixee au depart, la proportion p d'individus prets a voter pour ce candidat. 


B.2.2. Estimation par intervalle de confiance 

Le contexte est le meme que le precedent. Nous avons vu, dans la theorie sur l’echantillonnage. que si F est la 
variable aleatoire correspondant a la proportion d’un caractere dans un echantillon de taille n pris au hasard, 
alors F suit approximativement une loi normale : 


F N( P -,a p ) oucy p = ] j^—^ 


Nous avons deja remarque que le fait que p soit inconnu n'est pas genant dans les calculs a priori. Le probleme 
ici, c’est que nous ne connaissons pas l'ecart-type,/-^ — — . Nous le rempla£erons, dans la phase a posteriori. 


par son estimation ponctuelle (qui est 


PA~P e ) 

n — 1 


en general ou 


P e 0-~P e ) 


si la correction de biais n’est 


pas proposee ou encore .1 — si nous voulons une hypothese pessimiste). 
I 4n 


Cherchons un intervalle qui contient p avec une confiance arbitraire de 90 % (cela pounait etre un autre coefficient de 
confiance). Nous cherchons done un rayon r tel que : 

P(F-r^p ^ F+r) = 0,90 

Nous avons deja vu que cette probability pouvait s’ecrire de maniere plus pratique : 

P(p-r^F^p + r) = 0,90 


On sait que la variable aleatoire T = 


F-p 


suit la loi normale centree reduite M0 ; 1). 


Nous obtenons done, par centrage et reduction : 

P 


f \ 

p-r-p F-p p + r-p 
$ $ 


v 


= 0,90 


p / 


—v r 

— — 


= 0,90 




p y 


2U 


f \ 

r 


\°PJ 


- 1 = 0,90 


n 


f \ 

r 


\°PJ 


= 0,95 


r 

On cherche une borne t telle que : fl(7) = 0,95 avec t = — 

Par lecture inverse de la table de la loi normale centree reduite N ( 0 ; 1) : 

t= 1,645 

Ce qui nous permet de calculer r : r-to p 

Supposons maintenant l'echantillon preleve. Nous avons done une estimation pontuelle de p et a p . 
Ainsi, la realisation de l’intervalle de confiance dans l'echantillon est : 
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IC = 


Mz&2 . p'+J"'*-?') 


n - 1 


/i - 1 


On ne retiendra pas cette formule. 
Dans la pratique, on refait les calculs. 


Remarques : 

• Si on n'effectue pas la correction de biais, l’intervalle de confiance est : 


IC = 




On peut egalement se placer dans une hypothese pessimiste en choisissant un ecart-type maximal. Nous 

savons que la parabole d’equation v = x( I — x) admet un maximum egal a — en — . 

4 2 

Ainsi l'ecart-type maximal est . — . II a, de plus, l'avantage d'etre independant de p. 

V 4« 


Dans ce cas, la realisation de l'intervalle de confiance dans l'echantillon est : 

IC = 


,1 1 

P e -fJ ; Pe+tJ — 

^ An V 4n 


Exemple : 

A quelques jours d’une election, un candidat fait faire un sondage. Sur les 150 personnes interrogees, 45 se 
disent pretes a voter pour lui aux prochaines elections. 

45 

La proportion d'individus prete a voter pour ce candidat dans l'echantillon est ici de p c = 0,3. 


On a deja estime ponctuellement : 


p~=p e = 0,3 et % - 0,037 


Determinons maintenant une estimation de p par intervalle de confiance a 80%. 

Notons F la variable aleatoire correspondant a la proportion d'individus prets a voter pour ce candidat dans un 
echantillon de taille 150 pris au hasard. 

Nous avons vu qu’approximativement : 


pa-p) 


On cherche un rayon r tel que : 


F N(p;a p ) oiKT^j 


P(p - r<F<p + r) = 0,8 


m 


r 


y°pj 


- 1 = 0,8 


n 


r 


K° P J 


= 0,9 


Par lecture inverse de la table de la loi normale centree-reduite, on cherche une borne t telle que : 

11(f) = 0,9 avec f = 


La valeur t — 1,28 convient done : r = 1,28 a p 

Supposons maintenant l'echantillon preleve. Une estimation ponctuelle de a p est o), = 0,037. 
D’ou : r — 0,047 
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La realisation de l'intervalle de confiance dans cet echantillon est alors 


1C = [0,3 - 0,047 ; 0,3 + 0,047] 

IC = [0,253 ; 0,347] 

IC% = [25,3 ; 34,7] 

Nous pouvons estimer, avec une confiance de 80 %, que la proportion d’individus dans la population prets a 
voter pour le candidat en question est comprise entre 25,3 % et 34,7 %. 


Exercice : 

Une usine fabrique des cables. Un cable est considere comme conforme si sa resistance a la rupture X est 
superieure a 3 tonnes. L'ingenieur responsable de la production voudrait connaitre, en moyenne, la resistance a 
la rupture des cables fabriques. 

II n’est, bien sur, pas question de faire le test sur toute la production (l’usine perdrait toute sa production !). 

Un technicien preleve done un echantillon de 100 cables dans la production. Notons X la variable aleatoire 
correspondant a la force a exercer sur le cable pour le rompre. Le technicien obtient les resultats suivants : 

E( X ) = 3,5 tonnes 
a( X ) = 0,4 tonne 

Proportion de cables dont la resistance est superieure a 3 tonnes : p e = 0,85 

1 . a. Donner une estimation ponctuelle de la moyenne li et de l’ecart-type g de la variable aleatoire X dans la 

production. 

b. Determiner une estimation par intervalle de confiance a 95 % de la moyenne li de X. 

2. a. Donner une estimation ponctuelle de la proportion p de cables conformes dans la production, 
b. Determiner une estimation par intervalle de confiance a 90 % de cette proportion. 
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- RESUME - 

- Echantillonnage - 




- Estimation - 



Population de moyenne p inconnue el d'ecart-type a. 
Echantillon de taille n connu de moyenne p e et d'ecart-type a e . 

■»“ Une estimation ponctuelle de li est li c . 


Une estimation ponctuelle de a est . a e si n < 30 ou 

V n - 1 

tout simplement a e sinon (n > 30). 


®" Pour estimer li par intervalle avec une confiance C (par 
ex 95%), on cherche un rayon r tel que : 

P(p - r < X < p + r) = C 


ou X N 


f a A 

p ;-/= 

v v«y 


On exprime r en fonction de a et on remplace o par sa valeur 
connue ou son estimation ponctuelle. 

IC = [p e - r ; p e + r] 


Proportion inconnue p dans une population. 
Echantillon de taille n connu avec une proportion p,„ 


Une estimation ponctuelle de p est p e . 
Une estimation ponctuelle de a p est 


p,h-p,) si 


n — 1 


n < 30 ou J -^- 1 — sinon (n > 30). 


Pour estimer p par intervalle avec une confiance C 
(par ex 95%), on cherche un rayon r tel que : 

P(p -r^F<p + r) = C 

ou F N(p \o p ) avec a p = 

On exprime r en fonction de a p et on remplace a p par 
son estimation ponctuelle. 

IC = \p e - r ■ p e + r] 


Coefficient de confiance 

80% 

90% 

95 % 

99 % 

Valeur de n(f) 

0,9 

0,95 

0,975 

0,995 

Borne t 

1,28 

1,645 

1,96 

2,575 
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